AI资讯新闻榜单内容搜索- transform

此时此刻，两个Claude智能体正在无休止对话，无人干预

现在，AI 大模型已经疯狂到这种地步了吗？此时此刻，正有两个 Claude 模型在无休止地对话，它们在探索整个宇宙的奥妙。

来自主题: AI资讯

7927 点击 2024-03-31 14:59

CVPR 2024 | 让视频姿态Transformer变得飞速，北大提出高效三维人体姿态估计框架HoT

目前，Video Pose Transformer（VPT）在基于视频的三维人体姿态估计领域取得了最领先的性能。近年来，这些 VPT 的计算量变得越来越大，这些巨大的计算量同时也限制了这个领域的进一步发展，对那些计算资源不足的研究者十分不友好。例如，训练一个 243 帧的 VPT 模型通常需要花费好几天的时间，严重拖慢了研究的进度，并成为了该领域亟待解决的一大痛点。

来自主题: AI技术研报

8132 点击 2024-03-31 14:44

CNN、Transformer、Uniformer之外，我们终于有了更高效的视频理解技术

视频理解因大量时空冗余和复杂时空依赖，同时克服两个问题难度巨大，CNN 和 Transformer 及 Uniformer 都难以胜任，Mamba 是个好思路，让我们看看本文是如何创造视频理解的 VideoMamba。

来自主题: AI资讯

7312 点击 2024-03-24 21:44

COLING24｜自适应剪枝让多模态大模型加速2-3倍，哈工大等推出SmartTrim

哈工大联合度小满推出针对多模态模型的自适应剪枝算法 SmartTrim，论文已被自然语言处理顶级会议 COLING 24 接收。

来自主题: AI技术研报

5167 点击 2024-03-17 18:56

RNN效率媲美Transformer，谷歌新架构两连发：同等规模强于Mamba

去年 12 月，新架构 Mamba 引爆了 AI 圈，向屹立不倒的 Transformer 发起了挑战。如今，谷歌 DeepMind「Hawk 」和「Griffin 」的推出为 AI 圈提供了新的选择。

来自主题: AI技术研报

6248 点击 2024-03-03 18:10

首批类Sora模型出现，色拉布上线Snap Video，效果优于Pika、不输Gen-2

最近，OpenAI 视频生成模型 Sora 的爆火，给基于 Transformer 的扩散模型重新带来了一波热度，比如 Sora 研发负责人之一 William Peebles 与纽约大学助理教授谢赛宁去年提出的 DiT（Diffusion Transformer）。

来自主题: AI技术研报

4477 点击 2024-03-01 13:43

想训练类Sora模型吗？尤洋团队OpenDiT实现80%加速

根据 OpenAI 披露的技术报告，Sora 的核心技术点之一是将视觉数据转化为 patch 的统一表征形式，并通过 Transformer 和扩散模型结合，展现了卓越的扩展（scale）特性。

来自主题: AI技术研报

7799 点击 2024-02-29 13:35

12家创业公司+4家大厂全景图：谁会成为中国版Sora？

近期，DiT（Diffusion Transformer）论文的作者谢赛宁在朋友圈分享了他对 Sora 的看法，其中核心资源的排序是——人才第一、数据第二、算力第三，其他都没有什么是不可替代的。

来自主题: AI资讯

7682 点击 2024-02-27 14:07

国内高校打造类Sora模型VDT，通用视频扩散Transformer被ICLR 2024接收

2 月 16 日，OpenAI Sora 的发布无疑标志着视频生成领域的一次重大突破。Sora 基于 Diffusion Transformer 架构，和市面上大部分主流方法（由 2D Stable Diffusion 扩展）并不相同。

来自主题: AI技术研报

6207 点击 2024-02-24 14:54

补齐Transformer规划短板，田渊栋团队的Searchformer火了

最近几年，基于 Transformer 的架构在多种任务上都表现卓越，吸引了世界的瞩目。使用这类架构搭配大量数据，得到的大型语言模型（LLM）等模型可以很好地泛化用于真实世界用例。

来自主题: AI技术研报

8010 点击 2024-02-24 14:51